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Метод и информационная технология озвучивания 
математических формул на украийнском язьке 


У даній статті досліджується проблема автоматичного озвучення математичних формул та символів. 
Авторами отримані практичні результати, які дають змогу розробити достатньо якісну програму 
озвучення формул українською мовою. У результаті роботи розроблено інформаційну технологію 
перетворення математичних формул із різних форматів у мову МаїмМіІ, та генерування текстових 
файлів для озвучення українською мовою. 

Ключові слова: інформаційна технологія, математичні вирази, формули, синтезатор мови, 
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В данной статье исследуєтся проблема автоматического озвучивания математических формул и символов. 
Авторами полученью практическиє результать, позволяющиє разработать достаточно качественную 
программу озвучивания формул на украийнском язьгке. В результате работьт разработана информационная 
технология преобразования математических формул различньх форматов в язьтк МаїМІ, и созданиє 
текстовьїх файлов для озвучивания на украинском язьтке. 

Ключевье слова: информационная технология, математические вьтражения, формульі, 
синтезатор речи, озвучивания, преобразования, речь МашмМІ,, формат ТеХ, формат ОАІЗУ. 


Вступ 

Користувачі з вадами зору використовують для роботи з комп'ютером спеціальні 
програми читання екрана (з8сгееп геадег). Такі програми озвучують веб-сторінки та 
вміст вікон програм. Під терміном «озвучення» розуміємо використання синтезатора 
мови для промовляння вголос тексту, який міститься на веб-сторінці або в іншому 
електронному джерелі. 
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У процесі автоматичного озвучення інформаційного контенту виникає ряд про- 
блем, пов'язаних із перетворенням та поданням математичних формул. Через те, що 
процес озвучення формул українською мовою не автоматизований, користувачі змушені 
користуватися англомовними програмами озвучення формул, такими як МафРаїзу. 

Під час навчання та роботи незряча людина часто стикається з необхідністю 
прочитати математичні формули та символи, які зустрічаються в текстах книг чи 
навчальних підручників. Для читання математичних формул потрібні спеціальні за- 
соби, які використовують аналіз цих формул з подальшим перетворенням їх до 
потрібного формату, що дозволить їх озвучити. 

Дослідження, проведені авторами, показали, що найчастіше проблема розуміння 
математичних формул виникає при: 

1) читанні Інтернет-сторінок із технічно-прикладним вмістом (відсутні засоби, 
які би дозволяли під час роботи в мережі Інтернет у реальному часі перекладати та 
озвучувати математичної формули); 

2) читанні наукових статей у форматі РОДЕ (існують недосконалі засоби розпіз- 
навання математичних формул, представлених у вигляді рисунка з документів РОДЕ і 
транслювання їх мовою МафмМІ,, проте, відсутні засоби озвучення таких формул); 

3) роботі з паперовою книгою із використанням читаючого сканера (відомі за- 
соби відображення та розпізнавання математичного контенту, друкованого на папері, 
проте, відсутні засоби його озвучення). 

Необхідність озвучення формул виникає не лише при роботі з програмою читання 
екрана, але і при озвученні книг, газет, наукових статей. Озвучення усіх формул для 
інформаційного наповнення диктором вимагає значних часових затрат, а тому розроб- 
лення інформаційної технології для автоматизації процесу озвучення математичних 
формул українською мовою є актуальним завданням. Вирішення цього завдання є 
важливим для навчання студентів із вадами зору математичним та прикладним дис- 
циплінам у навчальних закладах різного типу. 


Огляд останніх досліджень 


На сьогодні відомі засоби озвучення математичних формул англійською мо- 
вою |1, |2|, проте процес озвучення формули українською мовою лишається не до- 
сліджений, що створює завади для озвучення контенту для україномовних кори- 
стувачів із вадами зору. 

Останні дослідження в галузі озвучення математичних формул |3-5| зосередже- 
ні лише на озвученні формул англійською мовою. Дослідження цих засобів показало, 
що вони не придатні для озвучення формул українською мовою та не містять засобів 
локалізації. 

Задача озвучення математичної формули лежить у площині задач комп'ютер- 
ного перекладу, оскільки має усі ознаки таких задач, а саме необхідність часткового 
розуміння змісту формули для правильної інтерпретації, побудову проміжного ком- 
п'ютерного запису формули та розроблення засобів кодування формули вихідною 
мовою. 

Застосування до читання формул популярного на сьогодні статистичного ме- 
тоду комп'ютерного перекладу |б| не є доцільним, оскільки немає відомих баз пара- 
лельних текстів «формула - україномовний текст». 

Найближче задача читання формули подібна до задачі перекладу з використан- 
ням універсальної проміжної мови «іпіегіїпоца» |7|. У випадку математичної формули 
такою проміжною мовою може бути мова математичної розмітки МафмМІ,, мова ТеХ, 
ОрепОїйсе Май або інша. 


234 «Искусственньтй интеллект» 2013 Хої 


Метод та інформаційна технологія озвучення математичних формул... вд| 


На сьогодні існує велика кількість електронних форматів для запису матема- 
тичних формул: ТеХ, МаШТуре, Едцайоп, ОрепОйїсе Маф, Мамі, та інші спеціалізо- 
вані мови. Крім того, у документах формули можуть зберігатися у вигляді растрових 
або векторних зображень. Таке розмаїття форматів спричинене незалежним розвитком 
систем редагування формул, який передував прийняттю єдиного стандарту, до якого 
можуть конвертувати формули різні математичні редактори. 

Таким стандартом стала мова МафмМіІ, (Мафетайса! МагКкир І апопаєєе), реко- 
мендована консорціумом ХУЗС. Мова МафмМІ, базується на мові розмітки ХМІ, 
(еХкепяїбіє МагКир Гапепаєе - розширювана мова розмітки) та призначена перш за 
все для комп'ютерного подання формул. Запис формули мовою МайфмМІ, громіздкий 
та не зручний для редагування користувачем. З іншого боку, формула мовою МафмІ, 
подана деревовидною структурою, яка дає змогу однозначно описати семантику ма- 
тематичного виразу в інформаційній системі |89-10). 

Мова математичної розмітки МафмМІ, забезпечує такі можливості: 

- кодування матеріалів математичного характеру для комунікацій всіх рівнів 
освітнього і наукового типу; 

- кодування як математичної символіки, так і її змісту; 

- створення шаблонів та інших прийомів математичного редагування; 

- перетворення в інші математичні формати презентаційного і семантичного 
характеру; 

- відображення формул із врахуванням особливостей конкретних програм 
візуалізації; 

- підтримка ефективних процесів перегляду довгих математичних формул; 

- можливості розширення. 

Альтернативою формату МаїрМІ, для подання семантики математичної формули 
є формат ОрепМаї П11). Формат ОрепМай задає лише семантику математичної форму- 
ли, натомість формат МаїфмМІ, може визначати структуру відображення математичної 
формули. На сьогодні формат ОрепМай ще не набув такої популярності, як МафМіІ,, а 
тому бракує засобів перетворення формул у цей формат. 

Ще одним форматом, який класично використовується для редагування та ви- 
дання наукової літератури, є формат ТеХ. ТеХ - це система підготовки документів 
типографської якості, особливо сильною стороною якої є набір математичних формул. 
Ця система була розроблена ще у 1970-х роках американським математиком Д. Кнутом. 

теХ зручно розглядати як спеціальну мову програмування: вихідний файл -- це 
програма, що описує, як повинні бути розташовані на друкованій сторінці текст і 
формули, сама система ТеХ грає роль компілятора, а в результаті компіляції ство- 
рюється документ типографської якості у форматі РІЕ, РозіЗсгірі або в традиційному 
для ТеХ'а форматі ДУМІ (ДеУісе Плерепаегпі). Стиль роботи при підготовці тексту в 
системі ТеХ відрізняється від стилю при роботі з редактором Місго5ой УМ/ога і є 
ближчим до програмування, ніж до редагування тексту. 

На відміну від мови МаїмМІ,, ТеХ не підтримує деревовидне подання формули 
та допускає неоднозначне трактування семантики математичного виразу. 

Серед засобів перетворення документа ТеХ на мову МаївМІ, найбільш якісною 
вважається програма ТЕМ, розроблена А. Хатчінсоном (І. Никсріп5оп) (12). Ця про- 
грама перетворює документ ТеХ у файл формату ХНТМІ,, до складу якого входять 
мамі, формули. 

Крім формул, поданих у вигляді структурованих даних, виникає потреба в пе- 
ретворенні формул, поданих у вигляді зображень. Такі зображення можуть бути от- 
римані зі сканера, документів у форматі РОЕ або неякісних Інтернет-сторінок, автори 
яких знехтували вимогою доступності. 
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Аналіз документів, у яких зустрічаються математичні формули у форматі РГІЕ, 
як і раніше є складним, невирішеним завданням. На сьогодні розпізнавання складних 
математичних формул із зображень можливе лише зі значними неточностями пере- 
давання змісту формули | 131. 

Програма Пйу використовує технологію оптичного розпізнавання символів ОСК 
(Оріса! сВагасіег гесоєпійоп) і застосовує структурний аналіз до отриманого резуль- 
тату 14). Використання програми ійу доцільне при розпізнаванні математичних 
формул із растрових зображень і РОДЕ файлів та для подальшого запису мовою МашфмМіІ.. 

Інші комерційні засоби редагування формул, такі як: МайТуре, МайСай, Мафе- 
тайса та інші підтримують збереження формул мовою МафмМІ.. Для запису формул 
мовою МаїфмМіІ,, які містяться в документах Місгозбойї УМ/ога та ОрепОїйсе, викори- 
стовують засоби перетворення документів у ТеХ, наприклад, СтіпеНО М/ога-іо- 
гатех та уугіїегЗаїех. 

На сьогодні, найбільш потужним програмним засобом, який може конвертувати 
і озвучувати математичні формули є комерційний продукт МаїфРаїзу (15|. МаївРаїзу 
озвучує формули лише англійською мовою, що є значним недоліком для україно- 
мовних користувачів. МаїРаїзу забезпечує повну підтримку математики у книгах, 
що «розмовляють» у форматі ДАЛІЗУ. 

Система керування цифровим доступом РАЇТ5У (Шієта! Ассез5ібІе Паїоглайоп 
Зузіеті) - це відкритий міжнародний стандарт для мультимедійного доступу, роз- 
роблений РрАІ5У-консорціумом разом з працівниками бібліотек, для осіб з фізич- 
ними недоліками та вадами зору у співпраці з передовими науковцями і користу- 
вачами з усього світу (16). Технологія РАЇ5У базується на синхронізації тексту, графіки 
і аудіозаписів на базі рекомендацій УУ3С (М/огід У/1де У/еб Сопз5огіит) відповідно до 
потреб людей, які вимагають особливого доступу до інформації. 

Головна перевага книги, що «розмовляє», поданої у форматі РАЇ5У, над 
звичайною аудіокнигою, полягає у можливості індексування і пошуку інформації за 
ключовими словами. Так, користувачі можуть прослухати всю книгу лінійно, від по- 
чатку до кінця, або використовуючи засоби навігації, які дозволяють швидко перехо- 
дити від одного розділу до іншого, від абзацу до абзацу, або відзначати закладкою 
відповідні місця в тексті для повторного прослуховування (прочитання). 


Цілі статті 


Фактично, задача озвучення формули зводиться до розроблення системи правил, 
за якими перетворюється внутрішнє представлення формули до зовнішнього пред- 
ставлення українською мовою. 

Авторам не відомі публікації українською мовою, де були би зібрані правила 
читання математичних формул, але відомі такі публікації російською мовою |17). Ці 
публікації узяті авторами за основу правил читання, враховуючи схожість української 
та російської мов. 

Процес аудіовідтворення формул та математичних символів українською мовою 
не досліджений. Немає систем озвучення формул українською мовою, що значною мірою 
звужує можливості незрячої людини при навчанні прикладним предметам у навчальних 
закладах. 

У статті обгрунтовано вибір мови МаїрМІ, для внутрішнього подання формул та 
описано розроблений авторами метод озвучення математичних формул українською 
мовою. 
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Авторами розв'язано задачу опрацювання, перетворення та озвучення математик- 
них формул, які зустрічаються у текстах, з якими працює незрячий користувач. Роз- 
роблений метод є частиною інформаційної технології озвучення формул, записаних у 
різних форматах. Інформаційна технологія включає в себе набір правил, що дає змогу в 
автоматизованому режимі розібрати математичну формулу, подану в різних форматах 
(ТеХ, РОЕ, ТРОС), та озвучити її українською мовою за допомогою синтезатора мови, 
який називається «український голос (ЖгУох - Ігор». 

Розроблення технології виконувалось із врахуванням подальшої практичної реалі- 
зації автоматизованої прикладної програмної системи комп'ютерного опрацювання 
та подання даних для людей із вадами зору. Результати досліджень авторів статті 
містять розроблену програму перетворення та озвучення математичних формул україн- 
ською мовою, що вирішує проблему повноцінного вивчення математики для незрячої 
людини та робить доступними електронні книги, в яких використовуються матема- 
тичні символи. 

Подальше вдосконалення розроблених технологій може здійснити значний 
внесок у вирішення проблеми інтеграції людей з вадами зору у суспільство, зокрема, 
навчання сліпих та людей з частковою втратою зору у вищих навчальних закладах. 


Основний матеріал. Вибір мови внутрішнього подання 
формул та запис формул українською мовою 


Враховуючи найбільше поширення мови МафмМіІ,, деревовидну структуру цієї 
мови та наявність засобів перетворення формул, записаних у різних форматах, до 
мови МафмМІ, доцільно використати саме мову МаїрМІ, для внутрішнього запису 
формул. Авторами обрано мову МАаШмМІ, як проміжну для засобів озвучення формул. 

Для подальшого запису математичних формул українською мовою авторами 
розроблено програму, яка називається МаїРіау. На вхід програма отримує формулу 
мовою МафміІ,, а на виході формує текст українською мовою, який описує формулу. 

На перший погляд, найзручніше для цього використати Х51/1 (еХіепзібіе З1уІЇезрееї 
ІГапоцаєе Тгап5їогтайогя - мову програмування, яка використовується для програ- 
мування перетворення документів ХМІ,.), але недоліки Х51/ синтаксису, обмеженість 
засобів програмування та складність супроводу Х51.Т, вимагають альтернативних під- 
ходів до перетворення МаймМіІ, формул |18|. Найчастіше, Х51/ використовується для 
перетворення структурованих ХМІ, документів, веб-сторінок або документів РРДЖЕ. 

Для перетворення математичних формул, поданих у різних варіантах запису 
мамі, (презентаційний та семантичний) у текст українською мовою, авторами статті 
розроблено спеціальну систему правил. Система складається з правил запису матема- 
тичних символів, операторів, загальних виразів та уточнених виразів. Правила для уточ- 
нених виразів необхідні у випадку, коли результат читання залежить не лише від вузла 


дерева, але і від значення його нащадку. Наприклад, х" варто прочитати «ікс квадрат», а 
не «ікс у степені два». Правила сформовані таким чином, щоб вихідний текст міг про- 
читати синтезатор української мови. 

Розроблені правила перетворення математичної формули поділяються на чотири 
групи: 

1. Правила перетворення символів. Відповідно до цих правил, МафрРіау пере- 
творює символи формул, записаних мовою МаймМіІ, наприклад, «х» - «ікс», «а» - 
«а», «Б» - «бе», «с» - «це», «а» - «де те», «ш221Б» - «безмежність» та ін. 
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2. Правила перетворення операторів. За допомогою цих правил перетворюють- 
ся оператори формул, наприклад, «-» або «тіпи58» - «мінус», «ї» або «рія» - 
«плюс», «7» або «ед» - «дорівнює», «йте5» - «помножити», «Ж» -- «плюс мінус», «(» - 
«відкрити дужку», «)» - «закрити дужку», «хш222В» - «інтеграл» та ін. 

3. Правила перетворення загальних виразів. Ці правила використовуються в 
наступних випадках: «па5ир» - «"число І" піднести до степеня "число 27», «питас» -- 
«число ІЗ поділити на "число 27», «па5дгі» - «корінь квадратний з "число 1"», 
«ромуег» - «число ІЗ у степені "число 27», «тоої» - «корінь степеня "число І" від 
число 25» таїн. 

4. Правила перетворення уточнених виразів. Ці правила використовуються в таких 
випадках: «роугег 2» - «квадрат», «роууег 3» - «куб», «тоої 3» -- «корінь кубічний від 
їчисло ІЗ», «арріу ріа8» - «число І плює "число 27» таїн. 

Для трансформування дерево математичного виразу МафмМіІ, подається множи- 
ною вузлів 5 - ПОР НИ та функцією відображення вузлів на список їх нащадків 


С.У -» І, де І, - множина усіх можливих списків сформованих на множині 5. 
Атрибутом Техі(5) кожного вузла 5 є 5 є текст, який зберігається у вузлі. Цей 
текст може бути тегом МаїмМіІ,, назвою математичної змінної, числовим записом 
або математичним символом. 
Правила, які застосовуються для трансформування вузлів, мають форму 


В -(і,п. ТС), 


де І - значення атрибуту Техі(5) вузла 5 до якого може застосовуватися правило, 
п - кількість нащадків вузла 5, Т - Ру - список довжини ий, який задає вимоги 


до кожного вузла нащадка, С - шаблон рядка, який генерується правилом. 

Шаблон С може містити посилання на значення вузлів нащадків, наприклад, 
«Збчисло ІЗ поділити на число 27», 

Усі правила трансформування впорядковано за пріоритетом від найбільш деталі- 
зованих до найбільш загальних та записано в список Киї!/еГ зі. Правило трансформуван- 


ня Ка (і, б: с) може бути застосоване до вузла 5, якщо виконуються такі вимоги: 

1. Техі(5)- Її; 

2. ІС (5) зп; 

3. Мі є (1,2,..при, з 'УТехі(С(5)|) є 1,, де С(5)|Й позначає і-й елемент списку 
С(5). 

У результаті застосування правила трансформування до вузла 5, текстовий 
атрибут Техі(5) замінюється на стрічку, згенеровану за шаблоном С, а усі вузли- 
нащадки вузла 5, видаляються. 

Процедура трансформування вузла 5 визначається рекурсивно за наступним 
алгоритмом: 

Крок 1. Трансформувати усі вузли-нащадки зі списку С(5). 

Крок 2. Знайти в списку Киї/еГ.і5ї перше правило, яке може бути застосоване до 
вузла 5 та застосувати його. 

Крок 3. Якщо на кроці 2 не знайдено жодного правила, результатом трансфор- 
мування вузла 5 буде Техі(5) - " -- Тех (С(5)Д| Що "Тех С(5)| п). 

Трансформування усього виразу МафмМіІ, полягає в застосуванні процедури 
трансформування до кореневого вузла. 
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Інформаційна технологія озвучення формул 
українською мовою 


Для озвучення математичних формул, записаних у різних форматах, авторами 
розроблено інформаційну технологію, яка складається із сукупності методів опрацю- 
вання та перетворення формул. Розроблена інформаційна технологія містить такі етапи 
опрацювання математичної формули: 

1. Сканування формули. На цьому етапі відбувається сканування формули з 
відповідного інформаційного джерела (газета, книга, електронний документ, зобра- 
ження тощо). Для прикладу, відскановано формулу з математичного друкованого жур- 
налу. Якщо ж формула представлена засобами мови МаїМІ,, то потрібно перейти 
відразу до третього етапу. 

2. Розпізнавання та перетворення формули до Мав МІ.. Наступним етапом 
є розпізнавання відсканованої формули, а також подання її мовою МаймМІ,. Для 
розпізнавання відсканованої формули або графічного зображення треба скористатись 
засобами програми Ілйу, яка дає змогу перекласти формулу мовою МаїрМіІ, або ТеХ. 
Отже, на виході ми отримуємо файл із розширенням "паті, в якому записана 
формула. 

3. Формування тексту для озвучення. На цьому етапі за допомогою розроб- 
лених авторами правил відбувається розбір математичної формули на ідентифікатори, 
числа та оператори для подальшого озвучення. На виході отримуємо текстовий файл у 
форматі ТХТ: «Ікс квадрат дорівнює ігрик квадрат плюс зет квадрат». 

4. Озвучення або збереження у форматі УУАУ. Цей етап виконує озвучення 
текстового файла, який був створений на попередньому етапі. На цьому етапі 
підключається синтезатор мови, використовується український голос. У результаті озву- 
чення ми отримуємо звуковий файл у форматі МАУ, який може бути використаний для 
звичайного прослуховування незрячим користувачем або ж при побудові аудіокниги. 

Для озвучення сформованого текстового файла математичної формули (етап 4) 
використано синтезатор мови, який називається «український голос 0 КгУох - Ігор», 
за основу якого взято голос диктора українського радіо Ігоря Мурашко. 

Цим голосом можна озвучувати українські (а також англійські та російські) 
тексти. «Український голос (ЖгУох - Ігор» має сильну лінгвістичну базу, великий 
словник (кілька десятків тисяч слів), підтримку словотворення та морфологічного 
аналізу текстів (191. 

У результаті озвучення отримано аудіофайл із записом формули у форматі "мам. 


Аналіз результатів 


На рис. 1 схематично зображено сукупність методів перетворення формул із різ- 
них форматів до МаймМІ, для подальшого озвучення. Ці методи формують інформа- 
ційну технологію перетворення формул для їх озвучення або запису в аудіо-файл. 

Спочатку відбувається аналіз формату, в якому подана математична формула і 
приймається рішення, яким чином вона буде перетворена до мови МаюфмМіІ.. 

Після запису мовою МаїМІ, формула перетворюється за алгоритмом пере- 
кладу, описаним раніше. 

Нами було проведено чотири групи експериментів з перетворення математичних 
формул у різних форматах на мову математичної розмітки МаїрМІ,, а також експе- 
римент з озвучення отриманих МафмМіІ, формул (експеримент Хо 5). 
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Рисунок 1 - Інформаційна технологія озвучення формул 


Для проведення експериментів з перетворення формул на мову МафмМіІ, взято 
набір математичних формул різної складності, від простих, Ма--Р -6, до складних, 


Доза» ра (а, сові Ь, 8іп ГО 


Тестова база для чотирьох груп експериментів містила усього 100 формул (по 
25 формул на кожну групу експериментів), з яких 20 - прості арифметичні вирази, 
20 - тригонометричні вирази, 20 - інтеграли та похідні, 20 - формули лінійної 
алгебри та 20 -- ряди, границі тощо. 

У ході проведення експериментів використано безкоштовне програмне забезпе- 
чення (0 кгУох, Тит, ОрепОїйсе) та демонстраційні версії комерційних продуктів (СтіпанО 
Ма Оаіїбез, тЙйуВеадег, МаШТуре тощо). 

Група експериментів М» 1 ("аос -2? «СтіпаЕО Мат» -? Тех -2 Теасоаде ІГаїех 
2? Маштмі,. 

Перша група експериментів полягає в перетворенні на мову МашймМіІ, набору 
формул, записаних у форматі текстового документа Місгобоїї М/ога. Ця група експе- 
риментів виконується покроково: 

Крок І: Засобами плагіну СтіпаЕО Май Оїбез було перетворено записані у 
документі Місго8оїї Мога формули у формат ТеХ. Плагін СтіпаАЕО Май Обіїбез містить 
набір повністю незалежних компонентів і забезпечує двостороннє перетворення між 
Місго5ой М/огі та ГаТеХ. Існують й інші методи для представлення документа 
Місго8ої Мога у ТеХЛ,аТеХ, наприклад, Мога2Тех, МаШТуре, уууМаге, гіїЛіаїех?е, 
ритідЗаюх. 
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Крок 2: На цьому кроці відбувається процес перетворення формули з формату 
ТеХ на мову МаїШМІ, Для цього нами обрано он-лайн сервіс Теасоде Гаїех (Пігр:// 
ууууму Леасоде.сот /зегутсеЛаїех), який забезпечує ввід формули у форматі ТехХ та пере- 
творення її на мову МафмМіІ,, а також дає можливість відображення формули у гра- 
фічному форматі (".рпо), яку зберігає в себе на сервері за статичною (фіксованою) 
адресою. В результаті ми отримуємо текст формули на мові МаїрвМІ,, який потрібно 
скопіювати з веб-сайту та зберегти у текстовому файлі з розширенням "паті. Найбільш 
поширеними редакторами (конверторами), які можуть перетворити формулу з ТеХ 
на мову МаїМІ,, є ТІМ (ТеХ і ХНТМІ ), Теасоде І аїех, ТеХтасз5, Атауа, МафТуре 
та ТеХЛ аТеХ то МаїміІ, (Машфмі, іо ТеХ) Опіїпе Тгапзіаюг. 

Група експериментів Ж» 2 (Ж.раї -2 Шп/їу -? Маг МІ,. 

Друга група експериментів полягає в перетворенні на мову МаїмМіІ, набору 
формул, записаних у форматі Адобе Кеадег, ".раї. Друга група експериментів вико- 
нується покроково: 

Крок І: Для підготовки документа з формулою у форматі Адобе Кеайег ми 
використали текстовий редактор Місгобоїї Мога (Файл -» Зберегти як "2 Документ 
в форматі РО); 

Крок 2: Далі ми скористались програмою для розпізнавання символів Іапйу, 
щоб розпізнати і записати формулу мовою МайїмМІ, Для цього у програмі ШНну 
відкриваємо наш файл з розширенням ".раї, обираємо мову розпізнавання (якщо до- 
датково потрібно розпізнати текст, у якому зустрічаються формули), вказуємо вихідний 
формат файла ХНТМІ, (МафміІ,) в полі «Оиіриї Ейе Еогтаї» та починаємо розпізна- 
вання за допомогою кнопки «Убаг: ОСВ». В результаті розпізнавання формули за- 
собами програми Пйу отримано ХНТМІ, файл, у якому записана ця формула мовою 
математичної розмітки МаїймМіІ.. 

Група експериментів Ме 3 ("Йіті -? виділення графічних об'єктів 7? /РС, 
РУС, СТЕ -2 Ін/їу -? МАаМІ). 

Третя група експериментів полягає в перетворенні на мову МаїрМІ, набору 
формул, записаних у вигляді веб-сторінки ".Біті. Далі описано проведення групи 
експериментів покроково: 

Крок 1: Для виділення графічних об'єктів відкриваємо веб-сторінку з формулою у 
браузері 1 клікнувши правою кнопкою миші на формулу вибираємо «Зберегти рисунок 
як» і зберігаємо на комп'ютер. В результаті отримано графічний формат формули (РС, 
РМО або СІЕ). 

Крок 2: Наступним кроком є розпізнавання збереженого з веб-сторінки графіч- 
ного формату формули за допомогою Пйу. Для цього у програмі Пайу відкриваємо 
цей файл, в полі «Пари! Рііе Еогтаї» вибираємо вхідний формат файла ".рпе, вказуємо 
вихідний формат файла ХНТМІ, (МафміІ, в полі «Оціриї Еіїе Еогтабї» розпізнаємо 
за допомогою кнопки «56аг! ОСК». В результаті розпізнавання отримано ХНТМІ, 
файл, у якому записана наша формула мовою математичної розмітки МаїймМіІ.. 

Група експериментів Х» 4 (МагТуре -? МагпмМІ,. 

Четверта група експериментів полягає в перетворенні на мову МаймМІ, набору 
формул, записаних засобами МайТуре. Оскільки засоби програми МайТуре не до- 
зволяють зберігати формули мовою МАаїРМІ, за замовчуванням, то для цього потрібно 
налаштувати програму. Для цього заходимо в налаштуваннях програми, в підменю 
«Си апа Сору Ртгеїегепсе5...» та вибираємо «Мамі, ог ТеХ» - МашфміІ, 2.0 (пате- 
зрасе айг) і знімаємо галочку з «Пісішде МафТуре ага їп ігапзіайоп». Це дає змогу 
копіювати перекладену на мову МаїМіІ, формулу з середовища МайфТуре. Наступ- 
ним кроком є збереження скопійованої формули у текстовому файлі з розширенням "паті. 
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Після проведення чотирьох груп експериментів, можна зробити висновки щодо 
ефективності того чи іншого способу перетворення математичної формули на мову 
мафмі.. 

При розпізнаванні математичних формул та перетворенні їх на мову МаїрМІ, 
засобами програми Пійу, було зроблено найбільшу кількість помилок. З 50 формул 
різної складності (25 формул з групи експериментів Хо 2 та 25 формул з групи 
експериментів Хо 3) було розпізнано правильно лише 21 формулу, що складає 4290. 
Власне недосконалість засобів розпізнавання цієї програми не дала точності при 


розпізнаванні ряду формул. Наприклад, формулу середньої складності Х/Р-кс за, 


програма Пйу розпізнала не правильно, з двома помилками: 3 /Р--с - 0. Для вирі- 
шення цієї проблеми необхідно використовувати додатковий інструмент - редактор 
Ійувфюог та в ручному режимі правити формулу. Головним недоліком цього спо- 
собу розпізнавання є великі часові затрати на ручне редагування неправильно роз- 
пізнаних формул. 

Натомість, результат проведення першої та четвертої груп експериментів дали 
на 10090 правильний результат з перетворення формул на мову МаїМіІ.. Це зумовлено 
точністю програм, які використовувались, а також, відсутністю графічних об'єктів, які 
потребують використання ОСК. 

Кксперимент Хе 5 (озвучення українським голосом формули, яка записана мовою 
Мантмі. 

Для проведення експерименту було взято сто п'ятдесят формул. Всі формули 
розбиті на групи: рівняння (раціональні, квадратні, лінійні), нерівності, тотожні ви- 
рази, дробові вирази та функції. В кожній групі присутні формули різної складності. 

Оскільки людина, як правило, психологічно сприймає одночасно 7-2 елементи 
(від 5 до 9 об'єктів), якими вона оперує в пам'яті, формули було погруповано за 
складністю. Складність формули визначалась кількістю операндів, чисел та матема- 
тичних операцій. 

Простою формула вважалась, якщо вона задовольняла наступні вимоги: 

- менше 5 операндів (А, Б, Х, 2 таїн.); 

- менше 5 математичних операцій (-, 7, 7, / таїн.); 

- менше 5 чисел (5, 16, 32, 12,5 тощо.). 

Формула вважалась середньої складності, якщо вона задовольняла наступні вимоги: 

- від 5 до б операндів; 

- від 5 до б математичних операцій; 

- від 5 до б чисел. 

Складною формула вважалась, якщо вона задовольняла вимоги: 

- більше 6 операндів; 

- більше 6 математичних операцій; 

- більше 6 чисел. 

Експеримент полягає в коректному сприйнятті на слух озвученої математичної 
формули та записі її у блокноті після/під час прослуховування. Озвучення групи 
математичних формул відбувається за допомогою розробленої авторами програми 
Маєфріау. 

Для проведення експерименту було запрошено групу з п'яти зрячих студентів 3 
та 4 курсів спеціальності комп'ютерні технології. Студентам було видано блокноти 
та ручки для запису прослуханих формул. 

Кожна із 150 спроб проведеного експерименту вважалась успішною, якщо після 
двох прослуховувань студент записав формулу в блокноті без помилок. 
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Результати експерименту зведені в табл. 1. 


Таблиця 1 - Результати експерименту Хо 5 


Вірних спроб прості формули формули середньої складні формули 
Учасники складності 
експерименту 
1-Й студент 50 50 48 
2-й студент 49 50 44 
3-й студент 50 48 40 
4-й студент 49 47 39 
5-й студент 50 44 40 
В результаті виконання першої частини експерименту над простими формула- 
б 50--49--.50-- 49 6 
ми ми отримали наступний результат: 5 х2 -99,296. По розрахункам 
другої частини експерименту над формулами середньої складності отримано резуль- 
50--50-- 48-47 --44 
тат: нене ЗБ х2 «95,60. Третя частина експерименту над складними 
- 48--44-40-35-40 
формулами показала такий результат: - х2 -82,890. 


Отже, можна зробити висновок, що розроблена програма озвучення математичних 
формул Мафріау показала хороший результат (92,59) для різних за складністю формул. 

Зі слів учасників експерименту головна складність полягала в розумінні синте- 
зованого голосу та швидкості відтворення, а також складність формули. 

Здебільшого, причиною помилок при записі озвучених формул був синтезатор 
української мови «український голос 0 КгУох - Ігор». Відповідно, якщо буде розроб- 
лений якісний синтезатор української мови, який максимально наблизить звучання 
до природного голосу, то відсоток розуміння озвученої формули з першого разу зросте 
до максимального. Проблема розроблення якісного синтезатора української мови 
залишається актуальною 1 не розв'язаною до кінця вже тривалий час. 


Висновки 


Дослідження проблеми автоматичного озвучення математичних формул та 
символів показало, що із застосуванням системи правил перетворення тегів МафМіІ, 
розроблено якісну програму озвучення формул українською мовою (92,59) для різ- 
них за складністю формул. 

Отримані результати вже дають змогу застосувати програму озвучення на 
практиці для навчання незрячих користувачів. Розроблено інформаційну технологію 
перетворення математичних формул із обраної множини форматів у мову матема- 
тичної розмітки МафмМіІ,, з якої генерується текстовий файл для озвучення україн- 
ською мовою. Також, стало можливим використання озвучених українським голосом 
формул для створення навчальних підручників з математичними формулами у фор- 
маті РАЇ8У засобами книг, що «розмовляють». Такі книги можуть використовува- 
тись, перш за все, для навчання людей із вадами зору математичним та прикладним 
дисциплінам як у середніх, так і у вищих навчальних закладах. Отже, розроблена 
авторами інформаційна технологія озвучення математичних формул, які зустрі- 
чаються в українських текстах, є важливою компонентою для створення контенту в 
форматі РАЇ5У для людей із вадами зору. 
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Подальше вдосконалення засобів озвучення математичних формул українською 


мовою вимагає розроблення якісного синтезатора української мови та вдосконалення 
методів підготовлення даних. У подальшому планується вдосконалити правила озвучен- 
ня формул із додаванням відмінків та уточнення правил озвучення великих формул. 
Отримані результати не мають аналогів в Україні та Росії та є співмірними з англо- 
мовними розробленнями. 
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ВКЕ5СМЕ 
М.Х. Раууаоу, О.А. ІосуїкКуу, У. У. Разісипук 
Метоа апа Гп/отгтаїоп Тесйпоїогру ої Маї-Іо-5реесй іп (Жгаїпіап 

Тре агісіе Фезсгібез Фе ргобіет ої ашотайс зреесп плайпетанса! Гоптиіаз апа зупбоїя 
(пзаїф-іо-єреесії їесрпоїогу ог ОКтаїпіап). Тбе ашіог5 деуеїоред іпіогттайоп (есплоїосу ої 
тафептайса! Гоппиіаз ігап5їогтайогп у дФїНегепі Гоптаїз апа (ехі Ніе8 Їог зреесії сепегайоп 
їп ОКтаїпіап. Тре пштегіса! ехрегітепіє оп а Їагее питБег ої едиайоп 5роууеа Ше еНесйуе- 
пез5 ої демеїоред тефод апа іпіогтабоп їесппоїосу ої плайетайса! Гогтиіає ігап5їогтайоп 
їп ОКтаїпіап. 

Тевійпе, Фе ашіотайс 58согіпо, ої піаЧШретабса! Богтиіа8 апа зутбоїз 5роугед аг Бе 
иц5е ої ігап5їогтайоп гиіе5 Їог МаїрМіІ, їассіпе деуеіорей Бу ашіогя геаспей Ше соттесі 
тези: - 92,596 Гог ФіНегепі сотріехтїу ої ТГогтиіаз. 

Кигфбег іпаргоуетепі ої плаїр-іо-5реесії гедицігеє Бе демеїортепі ої Бієр-диайту 
зупіпезі7ег апа іаргоміпо плеїродз ої ргерагіпо Чака ої (Жтаїпіап Іапспаєе. 


Стаття надійшла до редакції 03.12.2012. 
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